وفقی سازی الگوریتم نزدیکترین همسایه برای دسته بندی داده های جریانی
پایان نامه
- وزارت علوم، تحقیقات و فناوری - دانشگاه شیراز
- نویسنده محمد جواد زمردیان
- استاد راهنما منصور ذوالقدری جهرمی اقبال منصوری
- تعداد صفحات: ۱۵ صفحه ی اول
- سال انتشار 1390
چکیده
امروزه در بسیاری از کاربرد ها، جریان داده به سرعت و در حجم زیاد تولید می شود. یکی از روش های با اهمیت در کاوش داده، دسته بندی آن است. از چالش های مهم دسته بندی جریان داده، تغییر مفهوم داده با گذشت زمان است که نیاز به، به روز رسانی مدل دسته بندی را مطرح می کند. تاکنون بسیاری از روش های سنتی دسته بندی داده برای تعامل با جریان داده بهبود داده شده اند. یکی از این الگوریتم های سنتی یادگیری، الگوریتم نزدیکترین همسایه است که یکی از الگوریتم های جذاب حوزه داده کاوی است. الگوریتم نزدیکترین همسایه با توجه به مکانیزم ساده تصمیم گیری در تحقیقات گذشته بسیار مورد توجه قرار گرفته است. این الگوریتم برای دسته بندی داده های جریانی با مشکلاتی مواجه خواهد شد که یکی از این مشکلات حجم نمونه ها است. ضمنا تعیین تعداد همسایه ها نیز برای تصمیم گیری این الگوریتم چالش برانگیز است. در این رساله دسته بندی جدیدی مبتنی بر الگوریتم نزدیکترین همسایه پیشنهاد شده است. مدل افزایشی این دسته بندی کننده، برای دسته بندی جریان داده بکار رفته است. سرعت مناسب یادگیری، انعطاف پذیری در زمان پاسخ و پایداری در برابر اغتشاش از مزایای این روش افزایشی هستند. دقت روش پیشنهادی با روش-های شناخته شده در این حوزه روی مجموعه داده های استاندارد واقعی و مصنوعی مقایسه شده است. نتایج بدست آمده حاکی از بهبود دقت، زمان و حافظه در روش افزایشی پیشنهادی است
منابع مشابه
ارزیابی عملکرد رهیافت توسعه یافتهی نزدیکترین همسایه در شبیه سازی داده های هواشناسی روزانه
مولدهای هواشناسی (Weather Generators) با هدف تطویل سری اطلاعات انواع متغیرهای وضع هوا اعم از بارش، دما و رطوبت نسبی، برای ارتقاءِ فهم و درک از عملکرد هر سیستمی که اقلیم عامل تاثیرگذار بر آن باشد، توسعه یافتهاند. الگوریتمهای متفاوتی از این مولدها در دو نوع کلی پارامتری و ناپارامتری تا به امروز ارائه شدهاند. در این مطالعه کارایی مولد ناپارامتری k نزدیکترین همسایه با قابلیت برونیابی دادهها در س...
متن کاملارائه یک الگوریتم خوشه بندی برای داده های دسته ای با ترکیب معیارها
Clustering is one of the main techniques in data mining. Clustering is a process that classifies data set into groups. In clustering, the data in a cluster are the closest to each other and the data in two different clusters have the most difference. Clustering algorithms are divided into two categories according to the type of data: Clustering algorithms for numerical data and clustering algor...
متن کاملبهینه سازی گروه ذرات به روی پارامترهای کرنل و k نزدیکترین همسایه برای مسائل دسته بندی
در این پایان نامه یک روش حل مسائل دسته بندی ارائه می شود. کرنلها در روشهای حل مسائل دسته بندی کاربرد بسیاری دارند. با استفاده از کرنل، داده ها به فضایی با ابعاد بالاتر انتقال داده می شوند. به طور ایده آل انتظار می رود که در این فضا داده های مشابه در کنار یکدیگر قرار بگیرند. نو آوری این پایان نامه در به کار گرفتن روش دسته بندی k نزدیکترین همسایه در این فضا است. این عمل از نظر تئوری عملکرد مناس...
سیستم های دسته بندی فازی برای داده های جریانی
سیستم های خودگستر فازی روش هایی قدرتمند در جهت دسته بندی جریان های داده می باشند. در این سیستم ها، قوانین فازی به صورت خودکار تولید، به روز رسانی و حذف می گردند. با این حال، الگوریتم های معرفی شده تا این زمان نمی توانند به خوبی با مشکلات تغییر ناگهانی و تغییر تدریجی در مفهوم داده ها مقابله نماید. در این پایان نامه دو روش خودگستر آن لاین جهت دسته بندی جریان های داده معرفی شده اند، که بر خلاف روش...
15 صفحه اولدسته بندی داده های جریانی فازی با استفاده از تحلیل پوششی داده ها
در این تحقیق یک روش دسته بندی داده های غیرقطعی از نوع فازی که از جمله چالش برانگیزترین حوزه های تحلیل داده محسوب می شود، ارائه شده است. در واقع حجم بالا و پیچیدگی روش های تحلیل داده مانع از توسعه روش هایی جهت تحلیل داده های فازی می شود. با این حال در برخی حوزه های دیگر همچون برنامه ریزی ریاضی پیشرفت های چشمگیری در مدل سازی سیستم هایی که داده های فازی از آنها در اختیار است، بدست آمده است و لذا ت...
متن کاملارزیابی عملکرد رهیافت توسعه یافته ی نزدیکترین همسایه در شبیه سازی داده های هواشناسی روزانه
مولدهای هواشناسی (weather generators) با هدف تطویل سری اطلاعات انواع متغیرهای وضع هوا اعم از بارش، دما و رطوبت نسبی، برای ارتقاءِ فهم و درک از عملکرد هر سیستمی که اقلیم عامل تاثیرگذار بر آن باشد، توسعه یافته اند. الگوریتم های متفاوتی از این مولدها در دو نوع کلی پارامتری و ناپارامتری تا به امروز ارائه شده اند. در این مطالعه کارایی مولد ناپارامتری k نزدیکترین همسایه با قابلیت برونیابی داده ها در س...
متن کاملمنابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
ذخیره در منابع من قبلا به منابع من ذحیره شده{@ msg_add @}
نوع سند: پایان نامه
وزارت علوم، تحقیقات و فناوری - دانشگاه شیراز
میزبانی شده توسط پلتفرم ابری doprax.com
copyright © 2015-2023